Spaceship Titanic
チュートリアルやる
雑に GBDT に突っ込む
Score 0.79307, 1088/2238
いじってこれどのぐらい上げれるかな?
Leader Board のスコアに変な壁があるのは気になる、0.9台 → 0.82 → 以下団子
Number_missing Percentage_missing 出すのいいやん
Cabin が 300 ごとに type なのは気づいてなかった...
data.groupby(['HomePlanet','Destination','Solo','Cabin_deck'])['Cabin_deck'].size().unstack().fillna(0)
これええやん
めっちゃ欠損値埋めがんばるね
PCA のやつ何!
Post processing でトレーニングとテストセットで結果の分布みて閾値動かすのなるほど
Optimal Threshold
バイアス減らすやつでも見た
テストセットと同じ分布であるという仮定は必要
これで 0.80874 なのか〜というのはある
雑に GBDT に突っ込んで 0.79307 なので